# 获取数据中的json
# 导入模块
import requests
from bs4 import BeautifulSoup
import re

# 发送请求
response = requests.get('http://ncov.dxy.cn/ncovh5/view/pneumonia')
home_page = response.content.decode()  # 主页信息

# 使用bs4提取数据
soup = BeautifulSoup(home_page, 'lxml')
script = soup.find(attrs={'id': 'getListByCountryTypeService2true'})
text = script.string 

# 使用正则表达式提取json字符串
# 因为[]代表了字符集,所以需要转义。中间内容用.+匹配。
# 返回的是一个列表,取0号元素,将完整json取出
json_str = re.findall(r'\[.+\]',text)[0]  # 从文本中匹配[{...}]中的内容
print(json_str)                     
